202310.03162v1 


chinaXiv 


知识 管理 论坛 ISSN 2095-5472 CN11-6036/C 
Knowledge Management Forum 


【学 术 探 索 】 


ChinaXiv 合 作 期 刊 


E-mail: kmf@mail.las.ac.cn 
http://www.kmf.ac.cn 


科学 数据 开放 共 孚 中 出 版 商 政策 研究 


O ERE" 
! 北京 交通 大 学 图 书馆 北京 100044 
? 中国 科学 院 文 献 情报 中 心 北京 100190 


摘要 : [目的 /意义 ] 在 科学 数据 的 开放 共享 体系 中 ， 出 版 商 是 关键 利益 相关 者 。 出 版 商 与 包括 资助 者 、 
数据 中 心 与 知识 库 及 研究 机 构 在 内 的 其 他 利益 相关 者 合作 ， 共 同 促进 形成 开放 共享 的 研究 数据 文化 。 尽 管 
出 版 商 已 经 意识 到 科学 数据 开放 共享 的 重要 价值 ， 但 出 版 商 参 与 开放 共享 研究 数据 的 实践 ， 目 前 还 未 形成 
PUR. [ 方法 /过 程 ] 梳理 目前 出 版 商 有 关 开放 共享 数据 的 政策 ， 分 析 其 共性 与 差距 ， 对 目前 科学 数据 共享 
实践 中 ， 出 版 商 的 政策 进行 分 析 。[ 结果 /结论 ] 针对 出 版 商 提出 相关 政策 建议 ， 有 助 于 出 版 商 进 一 步 推动 


实现 开放 共享 研究 数据 的 目标 。 
关键 词 : 科学 数据 开放 共享 出 版 商 政策 
分 类 号 : G251 


引用 格式 : 鹤 雁 .科学 数据 开放 共享 中 出 版 商 政策 研 究 [JOL]. 知识 管理 论坛 , 2016, 1(3): 182-191[ 引 


用 日 期 ]. http://www.kmf.ac.cn/paperView?id=35. 


科学 数据 的 开放 共享 ， 具 有 重要 意义 ， 有 
利于 经 济 价值 与 学 术 价值 的 提升 。 正 如 欧盟 委 
员 会 所 指出 ,“ 科 学 数据 的 开放 获取 ， 提 高 了 
数据 质量 ,减少 了 重复 研究 的 成 本 ， 加快 了 科 
技 进步 ， 并 有 助 于 打击 学 术 造 假 ”。 英 国 皇家 
学 会 报告 认为 ， 开 放 对 于 科学 事业 具有 重要 价 
值 ， 开 放 可 以 识别 错误 ， 支持 、 反 对 或 优化 理 
论 ， 数 据 的 重用 可 更 深入 了 解 和 掌握 知识 一 。 


参与 其 中 。 这 些 利益 相关 者 类 别 多 样 ， 性 质 各 
异 ， 共 同形 成 科学 研究 的 生态 系统 。 根 据 各 利 
益 相 关 者 的 职能 ， 围 绕 人 研究 人 员 ， 将 这 一 系统 
进行 分 类 研究 ,确定 出 4 个 利益 相关 者 群体 ， 即 
资助 者 、 数 据 管理 者 、 研 究 机 构 与 出 版 商 作为 
关键 参与 者 ， 以 促进 和 实现 科学 人 研究 数据 的 开 
BRE 


在 这 一 系统 中 ， 每 类 利益 相关 者 都 有 各 自 


开放 数据 是 开放 科学 的 一 部 分 ， 具有 可 获得 、 可 
理解 、 可 评估 和 可 用 的 特征 ， 开 放 数 据 与 科学 
出 版 物 的 开放 获取 相 结 合 ， 可 以 有 效 沟 通 与 交 
流 科 学 的 研究 内 容 。 


@O 科 学 数据 开放 共享 中 的 出 版 商 
1.1 科学 数据 开放 共享 
在 科学 研究 过 程 中 ， 有 不 同 的 利益 相关 者 


不 同 的 职能 、 驱 动力 及 利益 点 ， 但 总 体 利益 与 
动机 相同 ， 即 促进 科学 的 进步 。 利 益 相 关 者 
的 利益 与 行为 动机 与 各 自 职能 连接 在 一 起 , 形 
成 了 科学 研究 系统 的 边界 。 该 系统 本 质 上 受 
到 外 部 和 内 部 因素 的 双重 影响 : 外 部 因素 可 
能 表现 为 政治 、 社 会 、 经 济 、 科 学 和 文化 体 
AS; 内 部 因素 包括 政治 意愿 、 经 济 及 学 术 
竞争 、 技 术 基 础 设施 、 法 律 、 道 德 等 因素 。 
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该 系统 的 价值 与 动机 是 外 部 和 内 部 因素 共同 
作用 的 结果 ， 其 中 外 部 因素 控制 资源 输入 到 
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该 系统 中 ， 内 部 因素 控制 这 些 资源 的 可 用 性 
和 分 配 。 如 图 1 所 示 : 


政治 


监护 研究 数据 


决策 者 与 资助 者 


< 一 经 济 


在 此 科学 开放 系统 中 ,利益 相关 者 群体 职 
能 众多 并 个 有 重合 ， 总 体 上 各 利益 相关 方 对 研 
究 数据 的 开放 获取 的 意义 已 达成 共识 ， 但 各 利 
益 相关 方 对 实现 开放 研究 数据 的 方式 的 认识 并 
不 一 致 。 本 研究 主要 探讨 在 推动 科学 数据 开放 
共享 中 ， 出 版 商 数据 政策 的 现状 、 问 题 ， 并 构 
建 相 应 模型 ， 提 出 相应 建议 。 
1.2 出 版 商 在 科学 数据 开放 共享 系统 中 的 目标 

在 促进 研究 数据 开放 共享 方面 ， 各 利益 相 
关 方 发 挥 不 同 的 作用 。 出 版 商 通 过 期 刊 向 作者 
提供 数据 共享 政 策 ， 在 数据 开放 中 发 挥 着 重要 
作用 。 研 究 出 版 商 的 数据 政策 ， 是 因为 这 是 在 
研究 过 程 中 将 数据 政策 与 研究 人 员 密 切 关联 起 
来 的 点 ， 为 发 布 研究 成 果 ， 研 究 人 员 有 动力 、 有 
可 能 遵守 数据 政策 。 同 时 ， 研 究 发 现 ， 虽 然 包 
括 出 资 者 和 研究 机 构 都 可 能 有 适用 于 研究 人 员 
的 政策 ， 但 遵守 这 些 政策 的 研究 人 员 的 比例 还 
很 低 。 研 究 人 员 没 有 遵守 数据 政策 的 直接 动 
力 ; 此 外 研究 人 员 在 需要 进行 数据 存档 时 ， 可 
能 也 没有 合适 的 机 构 知 识 库 可 以 选择 。 出 版 商 
提出 的 数据 政策 ， 是 在 研究 人 员 完 成 研究 过 程 
后 发 表 人 研究 成 果 前 ， 人 研究 人 员 有 可 能 、 有 动力 
遵守 出 版 商 的 数据 政策 。 


1.2.1 科学 数据 开放 共享 的 价值 

科学 的 思想 与 科学 的 证 据 互 相 佐证 ， 人 研究 
数据 和 科学 实践 之 间 的 联系 是 不 言 自明 的 ， 因 
此 ， 推 动 开 放 获 取 研 究 数据 ， 与 促进 科学 严谨 
的 目标 相 一 致 。 更 大 程度 地 共享 与 获取 数据 ,能 
加 强 科 学 的 基础 价值 ， 即 允许 科学 研究 有 效 地 
自我 校正 ， 以 便 二 次 分 析 、 检 验 、 质 疑 或 改进 
原 有 成 果品 。 此 外 ， 开 放 获取 政策 通过 减少 重 
HTE, 最 大 限度 地 减少 研究 人 员 用 在 搜索 信 
息 和 数据 方面 的 精力 ， 因 而 改善 了 他 们 的 工作 
条 件 。 

JISC 以 英国 高 等 教育 和 研究 机 构 为 例 ， 指 
出 研究 数据 的 监护 与 开放 共享 具有 如 下 利益 
中 研究 人 员 能 够 更 广泛 地 获得 数据 ， 从 而 促进 
更 多 的 跨 部 门 的 合作 ， 研 究 人 员 在 行业 、 政 府 
和 非 政 府 组 织 内 有 可 能 获得 大 量 的 教育 和 培训 
机 会 。 数 据 的 开放 共享 有 助 于 实现 数据 使 用 和 重 
用 ， 降 低 数据 的 收集 和 复制 成 本 ， 分担 数 据 收集 
的 直接 和 间接 成 本 ( 如 避免 调查 疲劳 ， 从 而 提高 
响应 率 等 ) ， 创 造 出 在 数据 收集 时 未 曾 预 想到 的 
新 的 利用 方式 ， 进 行 数据 挖掘 等 。@ 在 项 目 申请 
拨款 和 评 佑 阶段、 出 版 和 研究 评 佑 阶段 ， 更 容 
易 发 现 欺 诈 和 抄 作 ， 更 容易 进行 评 佑 和 同行 审 
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查 。 因 此 将 有 机 会 创造 更 加 完整 和 透明 的 科学 
wR. Qi ost At. ARE, RMS 
有 价值 的 资源 相 链 接 ， 从 而 有 更 多 的 机 会 提高 
研究 的 可 见 度 。 

科学 研究 系统 中 的 各 个 利益 相关 者 群体 认 
识 到 走向 开放 数据 的 利益 ， 认 同 将 数据 的 开放 
共享 置 于 战略 高 度 进行 考虑 。 科 学 表现 为 知识 
积累 的 过 程 ， 数 据 在 促进 早期 工作 中 起 着 重要 
作用 。 开放 获取 研究 数据 , 通过 避免 重复 劳动 , 促 
进 协作 ， 有 助 于 显著 加 快 这 一 科学 过 程 ， 从 整 
体 上 使 科学 成 为 更 加 透明 的 进程 ， 实 现 推动 公 
众 参与 ， 激 励 创 新 和 改革 公共 服务 的 宗旨 口 。 
1.2.2 基本 情况 

出 版 商 作 为 利益 相关 者 ， 越 来 越 关注 数据 
密集 型 研究 ， 认 同 开放 获取 研究 数据 的 意义 。 
很 多 出 版 商 认同 布鲁塞尔 宣言 ， 即 “所 有 的 研 
究 者 应 能 自由 地 获取 原始 研究 数据 。 出 版 商 鼓 
励 公开 公布 原始 研究 数据 结果 ， 将 相关 的 数据 
集 及 子 数据 集 与 论文 共同 提交 给 期 刊 ， 应 尽 可 
能 让 其 他 研究 人 员 自 由 获取 ”。 很 多 出 版 商 的 
数据 政策 为 强制 性 政策 ， 要 求 作者 将 文 持 出 版 
物 的 研究 数据 存储 在 经 认证 的 知识 库 中 ， 实 现 
开放 获取 。 研 究 表明 ， 如 果 期 刊 具有 强制 性 数 
据 政策 ,并且 有 可 获取 数据 的 声明 ， 那 么 在 线 
找到 该 数据 的 可 能 性 ， 几 乎 是 没有 类 似 政策 的 
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尽管 目前 出 版 商 已 开始 重视 出 版 物 的 开放 
获取 , 将 开放 获取 作为 一 种 出 版 的 商业 模式 ， 不 
过 出 版 商 参 与 研究 数据 的 出 版 ， 特 别 是 开放 获 
取 研 究 数据 ， 目 前 尚未 形成 规模 。 出 版 商 关 注 
研究 数据 及 其 开放 ， 重 要 原因 在 于 数据 为 出 版 
商 的 主要 产品 即 出 版 物 增 加 了 价值 ， 数 据 有 助 
于 验证 研究 成 果 ， 从 而 增强 了 所 发 表 研 究 成 果 
的 可 信 性 ， 而 可 信 度 对 于 研究 具有 重要 意义 口 。 
此 外 ， 资 助 机 构 的 政策 要 求 公 开 获 取 研 究 数 
据 ， 实 质 上 癌 出 版 商 施 加 了 压力 ， 出 版 商 需 要 
参与 到 研究 数据 开放 获取 中 ， 帮 助 作 者 和 研究 
机 构 符 合 出 资 人 的 要 求 。 现 在 ， 领 先 发 展 的 出 
版 商 开 始 与 其 他 利益 相关 方 合 作 ， 试 图 挖掘 研 
究 数据 的 潜能 ， 形 成 以 数据 为 基础 的 新 产品 和 
服务 ， 对 研究 数据 进行 同行 评议 ， 开 展 提高 数 
据 质量 的 其 他 服务 。 


O 出 版 商 主要 数据 管理 政策 


本 研究 根据 STM 的 年 度 报 告 中， 确定 出 以 
下 出 版 商 为 主要 分 析 对 象 ( 见 表 1) 。 这 十 大 
出 版 商 所 出 版 期 刊 占 到 2014 年 所 有 出 版 期 刊 的 
45.2%， 另 外 本 研究 将 开放 获取 出 版 商 ， 科 学 
公共 图 书馆 (PLoS ) 、 生 物 医学 中 心 (BioMed 
Central ) 的 数据 开放 政策 考虑 在 内 。 


表 1 以 期 刊 数 量 而 论 的 前 10 位 出 版 商 


序号 出 版 商 出 版 期 刊 数 量 〈 种 ) 占 所 有 期 刊 的 累积 百分比 〈%) 

1 Springer 2 987 10.6 
2 Elsevier 2 500 19.5 
3 Wiley 2 388 28 

4 Taylor & Francis 2 105 35.9 
5 SAGE 38.1 
6 Wolters Kluwer 40.5 
ii Hindawi 42.1 
8 CUP 43.3 
9 OUP 44.6 
10 NPG( 包括 Frontiers) 45.2 
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2.1 出 版 商 数据 政策 现状 
2.1.1 将 开放 获取 作为 默认 情况 

出 版 商 将 数据 的 开放 获取 作为 订立 政策 
的 基础 ， 如 PLOS 研究 数据 开放 获取 强制 性 政 
策 中， 指出 除了 极 少 数 例外 情况 ， 支 持 PLOS 出 
版 物 的 所 有 研究 数据 都 必须 开放 获取 。 作 者 在 
向 PLOS 提交 稿件 时 ， 要 同时 提交 数据 可 用 性 
声明 ， 在 声明 中 表明 遵守 PLOS 的 政策 规定 ,在 
手稿 成 功 提 交 后 ， 数 据 作为 最 终 手 稿 的 部 分 内 
容 发 布 。PLOS 要 求 作者 将 数据 存储 于 推荐 的 经 
认证 的 数据 中 心 或 知识 库 。 小 数据 集 可 与 稿件 
一 并 上 传 。PLOS 的 编辑 和 投稿 指南 ， 向 研究 人 
员 提 供 指导 ， 协 助 研 究 人 员 遵 守 期 刊 开 放 数 据 
政策 。 在 限制 数据 获取 的 情况 下 ，PLOS 有 权 发 
布 修正 说 明 ， 联系 作 者 的 机 构 或 资助 者 ， 其 至 
撤销 出 版 。 
2.1.2 新 的 出 版 形式 的 出 现 

出 版 界 越 来 越 关注 开放 数据 ， 产 生 了 一 种 
新 型 出 版 产品 , 即 数 据 期 刊 。 数 据 期 刊 的 出 现 , 与 
数据 可 以 单独 发 布 紧密 相关 。 数 据 的 单独 发 布 
可 以 确保 数据 作为 科学 记录 的 基本 组 成 部 分 ,以 
可 理解 的 形式 向 科学 界 提供 。 数 据 期 刊 是 同行 
评议 的 开放 获取 平台 ， 用 于 发 布 、 分 享 和 传播 
各 学 科 的 数据 。 发 表 的 数据 论文 包含 数据 集 的 
具体 相关 信息 ， 如 收集 、 处 理 方 式 等 。 发 表 的 
数据 论文 与 认可 的 知识 库 互 相关 联 ， 数 据 论文 
引用 存储 于 知识 库 或 数据 中 心中 的 数据 集 。 正 
如 澳大利亚 国家 数据 服务 中 心 (ANDS ) 在 其 数 
据 期 刊 指南 中 所 指出 的 ,“ 从 根本 上 说 ， 数 据 期 
刊 寻 求 促进 科学 认证 和 再 利用 ， 提 高 科学 方法 
和 结果 的 透明 度 ， 支 持 良好 的 数据 管理 方法 ,并 
为 数据 集 提供 一 个 可 访问 的 、 永 久 的 、 可 解析 
的 路 径 ”。ANDS 指出 ， 数 据 论 文 的 出 版 过 程 包 
括 对 数据 集 的 同行 评议 ， 最 大 限度 地 提高 了 数 
据 再 利用 的 机 会 ， 并 为 研究 人 员 提 供 了 学 术 认 
可 的 可 能 性 "1。 
2.1.3 同行 评审 

对 人 研究 数据 与 数据 出 版 物 开 放 获 取 的 关 
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注 ， 彰 显 了 研究 数据 的 科学 质量 及 人 研究 数据 
同行 评审 的 重要 意义 。 在 此 背景 下 ， 一 些 出 
版 商 将 同行 评议 的 范围 扩大 到 包括 数据 在 内 
的 同行 评审 。M. S. Mayernik 等 2014 年 进行 
了 有 关 “ 数 据 同行 评审 ”的 研究 ， 提 出 因为 出 
版 物 或 资源 类 型 有 所 不 同 ， 进 行 同行 评审 的 
方式 也 必须 有 所 变化 。 研 究 者 对 几 种 类 型 的 
评审 资源 进行 了 区 分 ， 包括 在 传统 科学 论文 
中 分 析 的 数据 ， 在 传统 科学 期 刊 上 发 布 的 数 
据 文章 ， 以 及 通过 数据 期 刊 发 布 的 开放 获取 
知识 库 与 数据 集 。M. S. Mayernik 等 针对 数 
据 的 同行 评审 、 数 据 的 质量 保证 过 程 确 定 了 
一 些 共同 因素 ,包括 : 可 通过 数据 中 心 或 知 
识 库 获取 数据 集 ; 数据 集 有 足够 的 信息 以 备 
评审 ; 期 刊 有 明确 的 方针 指明 审核 的 要 点 ， 指 
导 评 审 者 进行 数据 审查 等 "1 

开放 考古 学 杂志 (JOADI259 ) 对 所 有 提交 
的 数据 论文 采用 同行 评审 程序 ， 评 审 内 容 包 括 
论文 的 内 容 与 存储 的 数据 。 论 文 的 内 容 指 与 数 
据 集 的 建立 和 重用 相关 的 信息 ， 以 及 对 数据 集 
的 描述 。 存 储 的 数据 指 以 可 持续 性 模式 提交 到 
存储 库 的 数据 ， 包 括 其 许可 方式 。 
2.1.4 数据 引用 

除 对 数据 进行 同行 评审 外 ， 出 版 商 还 逐步 
引入 数据 引用 政策 ， 以 促进 研究 数据 的 标准 化 
使 用 。 人 研究 数据 对 研究 过 程 具有 重要 价值 与 意 
X, 为 扩大 高 质量 研究 数据 的 传播 ， 形 成 数据 
利用 的 规范 方式 ，FORCE11 制定 了 数据 引用 
的 主要 原则 。FORCE11 的 引用 原则 的 前 提 是 数 
据 引 用 需要 实现 人 类 和 机 器 均 可 读 。 该 数据 引 
用 原则 可 能 并 不 全 面 ， 主 要 目的 是 鼓励 各 学 科 
制定 体现 自身 特点 的 引用 方式 。 

FORCE11 原则 包括 : 说 明 数 据 引用 的 重 
要 性 ; 通过 数据 引用 促进 学 术 信 用 ; 数据 引用 
要 实现 机 器 可 操作 性 ， 包 括 全 球 永 久 唯一 标识 
符 ; 数据 引用 要 促进 对 数据 本 身 的 获取 ; 数据 
引用 应 该 具有 持久 性 ; 便于 识别 ,易于 获取 ， 可 
以 验证 ; 具有 互 操作 、 灵 活性 等 特点 。 
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2.1.5 内 容 发 现 和 链接 服务 

出 版 商 逐 渐 把 发 展 方向 转移 到 内 容 发 现 和 
链接 服务 ， 专 注 于 文本 与 数据 挖掘 (TDM ) T 
具 ， 以 便 能 开发 内 容 ， 进 而 提供 相关 服务 。 出 
版 商 越 来 越 关注 数据 挖掘 是 研究 人 员 利 用 大 型 
数据 库 的 内 容 、 数 据 和 出 版 物 的 需求 的 直接 
结果 。 一 份 文本 和 数据 挖掘 专家 小 组 的 报告 指 
出 ，TDM 是 一 种 重要 技术 ， 可 用 于 从 指数 级 增 
长 的 数字 数据 中 ,分 析 和 提取 新 的 见解 和 知识 中 。 
该 报告 的 结论 是 ， 因 为 研究 人 员 的 技能 和 技术 
不 断 提 升 ， 所 研究 的 数据 集 的 复杂 性 、 多 样 性 
及 规模 不 断 扩大 , 因此 TDM 有 可 能 会 更 加 重要 。 
但 对 于 利用 文本 与 数据 挖掘 工具 是 否 应 有 所 限 
制 ， 目 前 仍 有 争议 。 
2.2 期 刊 数据 政策 问题 
2.2.1 数据 格式 与 文件 大 小 的 差异 

期 刊 要 包括 支持 文章 结果 的 所 有 数据 ， 往 
往 是 很 难 实现 的 。 人 研究 的 方法 不 同 ， 产 生 的 数 
据 也 大 不 相同 ， 数 据 的 格式 和 文件 大 小 差异 
大 ,定性 研究 生成 的 数据 ,多 以 文本 形式 存在 , 例 
如 实地 观察 笔记 , 或 采访 或 报道 的 文字 记录 等 。 
定量 研究 生成 的 数据 ， 多 以 电子 表格 的 形式 保 
存 。 一 项 研究 可 能 产生 多 种 类 型 的 数据 ， 而 论 
文 可 能 包括 附加 文本 、 数 值 数据 集 和 数字 图 
像 ， 这 些 都 可 能 增加 论文 的 大 小 。 因 此 出 版 商 
表现 出 对 集成 到 每 篇 论文 中 的 数据 集 大 小 的 关 
注 。 某 些 出 版 商 开 始 尝试 出 版 在 线 期 刊 文章 ， 以 
包括 多 种 数据 ， 例 如 爱 思 唯 尔 的 有 关 未 来 的 文 
章 的 探索 "9 。 然 而 ， 并 不 是 每 一 种 期 刊 都 有 包 
括 各 种 数据 的 能 力 。 这 就 要 求 期 刊 的 办 刊 方针 
应 清楚 说 明 ， 作 为 论文 组 成 部 分 的 数据 ， 在 何 
种 程度 上 可 以 包括 在 论文 中 。 
2.2.2 机 构 知 识 库 的 成 本 

为 解决 出 版 商 服务 器 超载 的 问题 ， 将 期 
刊 文章 的 重要 数据 链接 到 一 个 特定 的 机 构 知 识 
库 ， 可 能 是 一 个 合理 的 选择 ,但 这 将 相关 的 长 
期 运营 成 本 转嫁 到 了 机 构 中 。 但 资助 者 目前 的 
基金 中 并 不 包括 这 部 分 资金 ， 而 机 构 可 能 也 并 
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不 愿意 在 当前 的 管理 费用 中 增加 这 种 支出 。 这 
就 使 得 在 机 构 知 识 库 中 存储 科学 数据 的 可 持续 
性 有 待 探 讨 。 
2.2.3 研究 人 员 对 数据 开放 的 认识 

许多 研究 人 员 并 不 知道 相关 的 知识 库 ， 为 
此 期 刊 数据 政策 应 说 明 ， 数 据 是 否 应 该 在 认可 
的 知识 库 中 存储 ， 是 否 要 使 用 永久 统一 资源 定 
位 符 (URL ) , 是 否 要 采用 某 种 形式 的 数据 引用 。 
数据 发 布 的 时 间 也 是 一 个 需要 关注 的 问题 ， 研 
究 人 员 并 不 关心 在 出 版 过 程 中 的 什么 时 候 数 据 
可 被 公开 访问 ， 而 是 关心 在 研究 过 程 中 何 时 数 
据 应 被 公开 访问 。 研 究 论文 并 不 是 在 研究 结果 
全 部 产生 后 才 会 形成 ， 而 是 在 研究 过 程 中 逐步 
产生 的 。 在 论文 发 表 的 同时 ， 是 否 适合 发 布 研 
究 数据 取决 于 多 种 因素 ， 诸 如 茶 些 形式 的 数据 
有 敏感 性 ， 要 保护 受 试 者 等 因素 。 


全 构建 期 刊 研究 数据 策略 模型 框架 


3.1 出 版 商 期 刊 政策 的 基本 要 求 

有 效 的 政策 制定 过 程 必然 需要 将 注意 力 集 
中 于 数据 共享 过 程 中 各 利益 相关 方 的 意见 ， 而 
目前 的 数字 基础 设施 在 不 断 变化 ， 出 版 商 、 知 
识 库 和 系统 之 间 ， 并 没有 强 有 力 的 措施 鼓励 共 
享 数 据 。 共 同 点 包括 : 中 出 版 商 共享 数据 的 方 
式 差异 很 大 ; @ 在 出 版 过 程 中 ， 出 版 商 对 所 接 
受 的 数据 类 型 、 数 据 应 存储 的 地 点 、 应 存储 的 
时 间 等 说 明 ， 模 糊 不 清 ; (3 研究 人 员 普 遍 赞 成 
共享 数据 ， 但 研究 人 员 不 知道 该 如 何 克 服 共享 
障碍 ; 由 研究 人 员 认 为 出 版 商 和 期 刊 有 关 数 据 
格式 和 存放 地 点 等 清晰 的 政策 ， 将 有 益 于 研 
究 ; 加 出 版 商 也 认为 在 数据 的 关联 与 舱 入 方面 
存在 障碍 。 

科学 数据 共享 的 许多 问题 ， 能 够 在 出 版 过 
程 中 通过 期 刊 强 有 力 而 明确 的 政策 加 以 解决。 
因此 ， 本 研究 的 目标 是 确定 能 推荐 给 期 刊 使 用 
的 政策 模型 。 研 究 收集 到 的 期 刊 政策 信息 ， 对 
材料 进行 分 析 后 ， 归 纳 出 目前 主要 的 政策 要 
求 ， 如 表 2 所 示 : 
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表 2 期 刊 数据 政策 的 基本 要 求 


序号 政策 要 求 

1 政策 应 有 一 般 性 声明 ， 列 举 数据 共享 的 益处 

2 政策 应 清楚 地 说 明 ， 属 于 期 刊 、 出 版 商 或 者 专业 协会 的 政策 

3 文章 中 包括 或 可 链接 的 数据 类 型 

4 数据 的 格式 ， 履 盖 所 有 学 科 领 域 准则 

5 相关 的 数据 说 明 ， 如 数据 引用 ， 其 他 元 数据 等 

6 数据 是 否 要 求 或 建议 共享 ， 以 及 对 数据 数量 的 限制 

7 根据 数据 类 型 ， 确 定数 据 存储 的 地 点 

8 凡 注 明 数据 是 可 用 的 ， 说 明 如 何 获取 

9 在 出 版 过 程 中 应 提供 数据 

10 是 否 有 时 滞 期 及 时 滞 期 的 长 度 

11 数据 是 否 可 以 公开 获取 、 自 由 获取 、 低 成 本 获取 或 有 其 他 级 别 的 限制 

12 作者 应 声明 数据 可 重用 的 所 有 情况 与 条 件 

13 是 否 有 数据 政策 的 例外 情况 

14 对 作者 遵守 政策 的 监管 方式 

15 对 作者 说 明 不 遵守 政策 的 后 果 

16 在 其 他 研究 人 员 投 诉 无 法 满足 数据 请 求 时 ， 期 刊 相 关 的 处 理 程序 说 明 
3.2 框架 模型 构 作 为 一 方 ， 与 出 版 商 的 另 一 方 进行 合作 ， 发 


基于 以 上 所 列 出 的 观察 ， 
研究 数据 政策 的 模型 框架 。 由 资助 者 和 研究 机 


形成 基本 的 期 刊 


展 数据 政策 。 表 3 为 所 构建 的 期 刊 研究 数据 策 
略 模型 框架 。 


表 3 期 刊 研究 数据 策略 模型 框架 


政策 TUR 内 容 说 明 具体 表述 方式 
总 体 要 求 目的 说 明 数据 开放 共享 的 益处 ” 本 出 版 社 认 为 ,支持 文章 得 出 结论 的 数据 应 为 所 有 研究 团体 可 用 


说 明 政策 适用 对 象 


明确 说 明 ， 存 储 数据 是 出 版 
的 必要 条 件 ， 还 是 仅 建 议 存 
储 数 据 


在 显著 位 置 明确 表示 ,希望 
作者 遵守 数据 政策 ， 并 对 包 
括 论文 出 版 与 数据 存储 之 间 
合理 的 时 间 区 间作 出 规定 

在 因 资 助 而 产生 研究 的 全 部 
或 部 分 数据 时 ， 政 策应 该 要 
求 作者 说 明 研 究 的 资助 者 


以 促进 相互 合作 ,证 明 研究 结果 的 可 验证 性 ， 并 鼓励 复 用 与 再 利 
用 数据 。 本 出 版 社 认为 , 通过 对 作者 工作 成 果 在 更 大 范围 的 开放 ， 
扩大 数据 的 透明 度 ， 将 提高 引用 率 与 提高 科学 质量 ,最 终 价值 将 
有 利于 作者 

中 本 研究 数据 政策 适用 于 本 学 会 的 政策 ;@ 本 研究 数据 政策 适用 
于 本 期 刊 的 编辑 政策 ;@ 本 研究 数据 政策 适用 于 本 出 版 社 的 政策 
中 所 提交 的 论文 得 以 出 版 的 条 件 是 ,论文 结论 所 基于 的 所 有 数据 ， 
必须 由 作者 存储 于 指定 位 置 ， 该 位 置 可 以 自由 公开 获取 数据 ， 这 
是 强制 性 要 求 ; @) 建 议 将 文章 结论 所 基于 的 所 有 数据 ， 由 作者 存 
储 于 指定 位 置 ， 该 位 置 可 以 自由 公开 获取 数据 ; @) 与 论文 相关 的 
数据 不 必 会 开 获 取 
中 本 出 版 社 希望 所 有 作者 遵守 人 研究 数据 政策 ; @ 本 出 版 社 在 收 到 
存储 库 已 正式 存储 数据 的 通知 时 ， 才 会 出 版 论文 ; @ 本 出 版 社 允 
许 作者 在 数据 公布 一 个 月 内 进行 数据 的 存储 


作者 必须 指明 研究 的 资助 者 ， 说 明文 章 中 哪些 数据 集 是 基于 资助 
产生 的 
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数据 提交 数据 明确 地 指出 ， 数 据 是 否 可 以 QD 数据 葵 入 到 发 表 的 文章 或 附录 中 ; @ 数 据 不 必 和 嵌入 到 发 布 的 文 
提交 作为 论文 的 组 成 部 分 ， 以 及 章 或 附录 中 ; @ 数 据 可 通过 文章 中 的 超 链接 获取 ， 这 将 引导 至 另 


与 评审 


数据 标准 
与 指导 


数据 的 保 
存 与 共享 


论文 中 是 否 应 包括 超 链 接 ， 一 台 服 务 器 ,该 服务 器 可 能 由 出 版 商 所 控制 ,也 可 能 与 出 版 商 无 关 ; 

或 者 说 ， 在 数据 与 论文 保存 @ 应 对 感 兴趣 的 研究 人 员 能 够 访问 该 数据 作出 相应 安排 

在 不 同 的 地 点 时 ， 是 否 通过 

超 链接 实现 关联 

考虑 到 必要 数据 和 补充 数据 中 可 链接 或 乱 人 到 文章 中 的 数据 ， 可 接受 的 数据 形式 包括 : 视频 

的 区 别 , 政策 应 该 明确 指明 , 图 像 、 音 频 文 件 、 软 件 、 电 子 表格 、 基 于 文本 的 文件 、DNA 序列 

所 接受 的 数据 的 类 型 等 ; @ 可 链接 或 伐 入 到 文章 中 的 数据 ， 不 可 接受 的 数据 形式 包括 : 
视频 图 像 、 音 频 文 件 、 软 件 、 电 子 表 格 、 基 于 文本 的 文件 、DNA 
序列 等 

清楚 地 表明 接受 的 数据 格 ”中 接受 任何 格式 的 数据 ; QA ESE ASCII 格式 的 数据 ， 以 实现 数 

式 ， 并 给 出 对 数据 保护 的 解 据 的 保存 和 互 操作 ; GO 接受 开放 格式 的 数据 ， 以 实现 数据 的 保存 


释 说 明 和 互 操作 ; 由 数据 需要 获取 代码 才能 实现 可 复制 ， 则 数据 与 代码 
共同 存储 
数据 明确 数据 是 否 应 该 进行 评 ”中 数 据 应 该 与 文章 一 起 提交 ， 以 便 由 指定 的 评审 小 组 进行 同行 评 
评审 审 ， 由 何人 进行 评审 审 ; @ 数 据 应 该 独立 进行 审查 ; @@ 不 对 数据 进行 审查 
数据 提供 元 数据 和 作者 标识 符 的 中 数据 集 必须 有 一 个 整体 的 数字 对 象 标识 符 (DOL) ; 数据 的 
标准 信息 每 个 项 目 都 必须 有 DOI; @ 数 据 应 与 相应 描述 的 可 阅读 文件 共同 


提交 ; @ 编 码 和 软件 、 缩 写 和 使 用 的 术语 ， 计 量 单位 和 任何 其 他 
相关 联 的 数据 的 细节 需 与 数据 共同 提交 


数据 对 从 较 大 的 数据 集中 选择 与 中 如 果 发 表 的 文章 是 基于 较 大 的 数据 集中 选取 的 有 限 数据 ， 仅 需 


指导 发 表 的 文章 最 相关 的 数据 “存储 与 论文 密切 必要 的 数据 ; @ 如 果 发 表 的 文章 是 基于 较 大 的 数 
时 ， 应 当 给 予 指导 据 集中 选取 的 有 限 数据 ， 要 求 整个 数据 集 可 以 公开 获取 ; UNE 
发 表 的 文章 是 基于 较 大 的 数据 集中 选取 的 有 限 数据 ， 作 者 可 以 选 
择 存储 部 分 或 全 部 数据 集 
对 数据 分 析 方法 的 公布 给 出 QD 在 相关 文章 中 应 明确 指出 数据 分 析 的 方法 ; @ 应 提供 数据 分 析 
指导 的 详细 方法 ， 以 实现 研究 的 可 复制 性 ; 咏 作 者 可 以 选择 概述 数据 
分 析 的 方法 


数据 说 明 数 据 是 否 应 存储 在 指定 中 本 期 刊 是 综合 性 期 刊 ， 数 据 必须 在 指定 的 存储 库存 放 ， 如 Dryad 
保存 的 存储 库 中 ， 或 由 作者 选择 等 ，@ 数 据 必须 在 由 本 协会 认可 的 存储 库 中 存放 ; @@ 数 据 可 以 在 


存储 地 点 具有 认可 资质 的 存储 库 中 存放 ; @ 数 据 可 以 在 主要 作者 所 在 的 机 
构 知 识 库 中 存放 ; @@ 数 据 可 存储 于 由 作者 自由 决定 的 可 信 的 存储 
库 中 ; (6) 数据 可 以 通过 相应 安排 ,方便 研究 人 员 获 得 数据 
数据 如 果 与 男 一 台 服 务 器 上 中 用 于 连接 到 数据 的 URL 必须 可 永久 链接 ; @ 用 于 连接 到 数据 的 
的 论文 链接 ， 数 据 政策 应 该 URL 必须 是 数字 对 象 标识 符 ; @) 作 者 可 以 使 用 统一 资源 标识 符 以 
明确 应 该 使 用 的 URL 形式 ”链接 数据 到 文章 ; 中 作者 可 以 使 用 持久 统一 资源 定位 符 以 链接 数 
据 到 文章 


数据 对 数据 引用 作出 说 明 ， 给 出 不 需 引 用 数据 ，@@ 作 者 可 以 选择 引用 数据 ，@ 数 据 应 采用 下 面 
引用 数据 引用 格式 的 指导 的 方法 进行 引用 ， 如 .….… 
数据 说 明 公开 发 布 数 据 是 否 有 时 加 论文 一 发 表 ， 即 可 公开 获取 数据 加 论文 发 表 之 前 ， 可 以 公开 


By 


A 取 rir) 获取 数据 ; @ 论 文 发 表 至 少 某 个 阶段 后 ， 可 以 公开 获取 数据 ; 外 


文章 发 表 之 前 必须 存储 数据 ; @D 有 时 湿 期 的 文章 发 表 时 ， 可 以 存 

储 数 据 
在 政策 允许 某 些 类 型 的 数据 期 刊 编辑 委员 会 ， 认 同 研究 数据 有 不 适宜 公开 获取 的 情况 ， 但 作 
有 例外 获取 的 情况 时 ， 应 明 者 需 说 明 可 能 会 造成 的 后 果 ， 如 : 
确 说 明 例外 的 标准 QD 研究 参与 者 个 人 或 家 属 的 生命 或 生活 会 受到 严重 损害 

@ 对 已 成 熟 的 行业 造成 严重 后 果 

@) 对 国家 安全 造成 严重 后 果 等 


( 续 表 3 ) 
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数据 所 有 数据 要 求 作者 说 明 相关 数据 或 者 应 明确 说 明 再 利用 的 范围 等 ， 例 如 ， 可 使 用 广泛 理解 接受 的 CC 
权 与 安全 所 有 数据 的 不 同 部 分 的 知识 产权 许可 ， 作 为 再 使 用 规范 进行 说 明 。 作 者 的 声明 应 包括 先前 的 知识 


权 状况 


产权 及 再 利用 的 要 求 ， 适 用 于 出 资 者 或 机 构 的 政策 ， 包 括 时 洲 


与 敏感 数据 的 处 理 问题 ， 如 : 本 数据 是 在 资助 者 资助 下 产生 的 结 
果 ， 作 者 、 所 属 机 构 及 资助 者 遵守 相关 知识 产权 政策 。 数 据 的 发 
布 符合 资助 政策 ， 遵 守 “ 署名 非 商业 相同 方式 共享 (CC BY-NC- 


SA) ae 


6 NH ERSA A 


隐私 说 明 对 人 类 受 试 者 数据 公布 中 在 存储 数据 之 前 ， 人 类 受 试 者 的 数据 标识 如 姓名 、 地 址 、 出 生 


保护 的 伦理 问题 的 处 理 方式 


监管 据 政策 的 后 果 及 监管 方式 


日 期 、 身 份 识别 号 码 ， 电 话 号 码 等 应 当 移 除 ; @ 人 类 受 试 者 及 其 
他 敏感 数据 ， 在 数据 发 布 之 前 允许 有 时 滞 期 ;号 个 别 研究 人 员 要 
获得 人 类 主体 和 其 他 敏感 数据 ， 可 由 作者 进行 特定 安排 ; 电 在 特 
殊 情 况 下 ， 人 类 受 试 主体 和 其 他 敏感 数据 可 被 例外 允许 获取 
对 作者 提供 指导 ， 以 使 个 体 中 在 敏感 数据 不 适 于 公开 的 情况 下 ， 作 者 应 该 作出 安排 ， 

研究 人 员 可 以 获取 敏感 数据 个 别 研究 人 员 获 取 数 据 ; @ 在 敏感 数据 不 适 于 公开 的 情况 下 ， 作 

者 应 该 作出 安排 ， 以 便于 个 别 研究 人 员 可 以 复制 研究 ; @ 在 数据 

为 敏感 数据 的 情况 下 ， 可 提供 作者 的 联系 方式 给 有 关 方面 

数据 监管 数据 明确 列 出 不 遵守 期 刊 研究 数 中 如 果 本 期 刊 收 到 其 他 研究 人 员 无 法 获取 已 出 版 论文 相关 数据 的 
投诉 ， 作 者 必须 出 示 有 关 已 存储 数据 的 证 明 ; @ 如 果 不 遵守 本 协 


以 便于 


会 的 数据 政策 ， 本 协会 将 撤销 作者 的 会 员 资 格 ; 号 如 果 相 关 数 据 
未 在 规定 时 间 期 限 内 存储 ， 本 出 版 社 将 不 会 出 版 作者 撰写 的 相关 


文章 


3.3 实施 方式 


3.3.1 逐步 制定 出 版 物 的 支持 性 数据 的 强制 性 开 
放 共 享 政策 

出 版 商 应 该 支持 期 刊 编辑 制定 研究 数据 的 
强制 性 政策 ， 从 而 提高 研究 过 程 透明 度 ， 扩 展 
研究 数据 的 潜力 。 数 据 的 编辑 政策 应 解决 诸如 
文档 、 元 数据 、 数 据 出 版 格式 、 许 可 、 引 用 等 
问题 。 编 辑 政策 要 求 作 者 在 文章 提交 过 程 和 同 
行 评议 过 程 中 ， 提 交 数 据 的 可 用 性 描述 。 对 提 
交 的 文章 不 符合 规定 的 情况 ， 政 策应 提出 对 应 
的 措施 ， 如 撤销 发 表 的 文章 。 
3.3.2 与 认证 知识 库 和 数据 中 心 协作 ， 简 化 数据 
提交 流程 

出 版 商 可 按照 相关 标准 考查 知识 库 与 数 
据 中 心 的 可 信和 度 ， 与 符合 数据 认证 标准 的 数 
据 中 心 与 知识 库 协作 。 类 似 的 知识 库 或 数据 
中 心 可 以 是 主题 明确 的 学 科 知 识 库 ， 也 可 以 
是 机 构 知 识 库 或 综合 知识 库 。 二 者 的 合作 应 
该 会 产生 积极 影响 ， 为 研究 人 员 和 研究 机 构 
提供 高 品质 的 产品 和 服务 ， 服 务 具 有 可 操作 
性 、 技 术 上 无 颖 的 特点 ， 从 而 实现 以 开放 格 
式 传 播 和 保存 高 质量 的 学 术 产 品 和 研究 数据 。 


对 于 没有 公认 的 数据 中 心 或 知识 库 的 学 科 ， 出 
版 商 对 人 研究 人 员 提 供 指导 和 帮助 ， 提 供 适 合 
存储 与 获取 的 机 构 知 识 库 建议 , 或 提供 商业 
数据 服务 。 在 这 方面 ， 出 版 商 的 角色 应 该 是 
更 多 地 促使 学 术 团体 建立 资源 库 评 佑 准则， 从 
而 帮助 研究 人 员 选 择 合适 的 存储 库 。 当 学 术 
界 建立 起 知识 库 的 认可 标准 ， 出 版 商 就 可 以 
通过 期 刊 政策 执行 这 些 标 准 。 
3.3.3 数据 作为 一 流 学 术 成 果 ， 接 受 同 行 评议 
出 版 商 的 主要 职责 之 一 是 确保 出 版 物 的 高 
质量 ， 而 研究 数据 同行 评审 制度 的 建立 ， 有 助 
于 提升 出 版 产品 的 品质 。 同 行 评审 过 程 ， 应 详 
细 说 明 评 审 的 标准 ， 要 评估 研究 数据 的 技术 与 
质量 问题 ， 技 术 方 面 如 考量 数据 集 的 完整 性 和 
一 致 性 ， 收 集 数据 的 标准 ， 使 用 的 软件 等 ; 研 
究 数据 的 科学 质量 则 由 研究 团体 通过 出 版 前 与 
出 版 后 的 同行 评审 进行 评 佑 。 同 行 评审 流程 
中 ,出 版 商 也 应 该 探索 对 评审 者 的 激励 方式 ， 包 
括 支 付 酬金 , 邀请 编写 特 稿 ,加 入 编辑 委员 会 , 其 
至 聘用 一 些 专家 进行 内 容 评审 。 
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3.3.4 发 展 有 关 研 究 数据 引用 的 策略 

研究 数据 通过 传统 的 出 版 过 程 传播 ， 为 
实现 数据 的 长 期 可 重用 ， 需 建立 并 使 用 数据 的 
引用 标准 。 在 这 方面 ， 出 版 商 应 要 求 出 版 物 及 
相关 的 数据 可 引用 ， 并 为 数据 的 引用 提供 明 
确 指导 。 在 说 明 数 据 引用 时 ， 出 版 商 可 参照 
一 些 已 有 的 实践 ， 如 Forcell" 的 原则 ， 参 与 
DataCiter "1, 加 入 到 研究 界 和 编辑 讨论 的 过 程 中 。 
数据 引用 应 包括 DOI， 以 及 使 用 许可 信息 ， 如 
创作 共用 许可 ， 数 据 的 引用 方式 最 好 是 机 器 可 
操作 的 , 可 让 用 户 知道 可 以 如 何 处 理 研究 数据 。 
3.3.5 建立 许可 政策 鼓励 进行 文本 数据 挖掘 

出 版 商 的 编辑 政策 应 以 清晰 的 方式 ， 说 明 
研究 数据 的 发 布 与 获取 方式 ， 如 默认 或 建议 开 
放 获 取 等 。 考 虑 到 文本 数据 挖掘 工具 可 带 来 显 
著 经 济 效益 ， 鼓 励 出 版 商 调整 策略 ， 人 允许 研究 
人 员 在 研究 中 使 用 这 种 技术 。 


人 @ 结 语 


尽管 出 版 商 已 经 强烈 关注 出 版 物 的 开放 
获取 ， 将 开放 存 取 作 为 一 种 商业 模式 ， 但 出 版 
商 参 与 研究 数据 ， 特 别 是 开放 研究 数据 ， 还 未 
形成 规模 。 出 版 商 关 注 研究 数据 与 研究 数据 开 
放 ， 是 因为 数据 为 出 版 商 的 主要 产品 即 出 版 物 
增加 了 价值 ， 通 过 对 研究 成 果 的 验证 功能 ， 增 
强 了 所 发 表 研 究 成 果 的 可 信 性 ， 而 可 信 度 对 于 
研究 具有 重要 意义 。 同 时 出 版 商 为 应 对 来 自 于 
出 资 人 对 开放 获取 的 压力 , 也 在 逐步 制定 政策 。 

出 版 商 和 出 版 商 的 数据 政策 在 更 广泛 地 采 
用 数据 归档 ， 与 协助 数据 存档 政策 模型 的 发 展 
过 程 中 ， 可 以 发 挥 关键 作用 。 出 版 商 所 提出 的 
数据 政策 , 应 能 体现 透明 性 , 实现 重用 的 可 能 , 提 
出 存储 数据 的 要 求 ， 提 供 对 数据 结构 和 元 数据 
的 指导 , 向 作者 指明 适当 的 网 络 链接 的 存储 库 
数据 政策 不 仅 有 利于 研究 人 员 自 己 及 相同 或 相 
关 领 域 同行 的 研究 ， 同 时 促进 了 数据 归档 和 数 
据 链 接 ， 完 善 了 数据 的 存储 。 
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Abstract: [Purpose/significance] Publishers are key stakeholders in the process of openly sharing 
scientific data. Publishers cooperate with funders, data centers and research institutions to contribute to a 
culture of openly sharing high-quality research data. Whereas publishers have placed muchemphasis on 
open access to scientific data, recently they are engaged with research data in particular. [Method/process] 
This study provided an overview of the current policies, practices and provided policy recommendations for 
publishers. [Result/conclusion] These recommendations will assist publishers in furthering the goals of open 

access to scientific data in their organizations and networks. 
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